Utilisation de la langue naturelle pour l'interrogation de documents structurés
نویسندگان
چکیده
RÉSUMÉ. Le langage de requête est l’indispensable interface entre l’utilisateur et l’outil de recherche. Simplifié au maximum dans les cas où les moteurs indexent essentiellement des documents plats, il devient fort complexe lorsqu’il s’adresse à des documents structurés et qu’il s’agit de définir des contraintes portant à la fois sur la structure et le contenu. L’approche icidécrite propose d’utiliser la langue naturelle comme interface pour exprimer de telles requêtes. L’article décrit dans un premier temps les différentes phases qui permettent de transformer (dans un cadre de recherche d’information) la requête en langage naturel en une représentation sémantique indépendante du contexte. Des règles de simplification adaptées à la structure et au domaine du corpus sont ensuite appliquées, permettant d’obtenir une forme finale, adaptée à une conversion vers un langage de requête formel. L’article décrit enfin les expérimentations effectuées et tire les premières conclusions sur divers aspects de cette approche.
منابع مشابه
Modèle d'indexation de documents peu symboliques dans des documents structurés: L'exemple du graphique dans un corpus de documents techniques
RÉSUMÉ. Cet article s’intéresse à l’indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d’exploiter le contenu des données symboliques avoisinantes afin d’en extraire les fragments adéquats pour compléter l’indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d’une application dans un contexte professionnel : indexer...
متن کاملDegré de relation sémantique dans une ontologie pour la commande en langue naturelle
Résumé : Dans la communication homme-machine en langue naturelle, le système doit être capable d’associer les termes de l’utilisateur avec les concepts manipulés par l’agent artificiel. Dans cet article, nous proposons une mesure de degré de relation sémantique entre deux concepts d’une ontologie pour faciliter cette phase dite « d’interprétation sémantique ». Nous proposons une généralisation ...
متن کاملRestructuration automatique de documents dans les corpus semi-structurés hétérogènes
Résumé. L’interrogation de grandes bases de documents semi-structurés (type XML) est un problème ouvert important. En effet, pour interroger un document dont le schéma est nouveau, un système doit pouvoir soit adapter la requête posée au document, soit adapter le document pour pouvoir lui appliquer la requête. Nous nous positionnons ici dans le cadre de la restructuration de documents qui consi...
متن کاملUn modèle pour l'interrogation visuelle des documents structurés
In this article, we present a visual querying model of the structured documents making it possible to represent graphically the users query in the form of graph, thus to carry out query of a rare syntactic and semantic complexity. The model is validated by the development of an XmlBrowser prototype for seamlessly browsing and querying a collection of structured document (Xml). MOTS-CLÉS : XML, ...
متن کاملAnalyse multidimensionnelle de documents via des dimensions OLAP
RÉSUMÉ. Avec l’émergence de formats de données semi-structurés (tels que XML), le stockage de documents dans un entrepôt centralisé est apparu de façon naturelle comme une adaptation des entrepôts de données. De nos jours, les systèmes OLAP (On-Line Analytical Processing) font face à une part grandissante de données non numériques. Cet article présente un environnement pour l’analyse multidimen...
متن کامل